Wie arbeiten Theorien und Hypothesen bei empirischer Forschung zusammen? Aus Theorien werden Hypothesen abgeleitet, die empirisch getestet werden (Alternativerklärungen werden ausgeschlossen). Dieser Vorgang widerlegt die Theorie oder stärkt sie mit Befunden. "Was ist ""Erklären"" nach dem ""Deduktiv Nomologischen Modell""?" Die Anwendung einer allgemeinen Gesetzmäßigkeit auf ein konkretes Phänomen. Warum tritt ein Phänomen auf == nach welchen allgemeinen Gesetzen und aufgrund welcher Vorbedingungen tritt es auf? 5 Eigenschaften, nach denen man eine Theorie bewerten kann? Parsimonität → wenige Konzepte Spezifikation → wenige offene Fragen Breiter Geltungsbereich → unterschiedliche Phänomene Falsifizierbarkeit → Gültigkeit kann kritisch überprüft werden Gültigkeit → empirisch Bewährt Wie kann man eine Hypothese endgültig belegen? Gar nicht! Hypothesen können nur widerlegt werden. Sie bleiben Vermutungen. 5 Eigenschaften von Hypothesen? Folgt logische aus einer Theorie Hat Wenn-Dann Struktur (Ursache - Wirkung) Macht eine präzise Vorhersage Ist empirisch prüfbar Ist prinzipiell widerlegbar (falsifizierbar) Experimenteller Ansatz vs. Korrelativer Ansatz zum Überprüfen von Hypothesen? Experimentell: Gezielte Manipulation/Variation der UV Korrelativ: Messung natürlicher Unterschiede der UV Was ist eine Operationalisierung? Messbarmachung → wie wird ein theoretisches Konstrukt messbar gemacht? Längsschnittstudien vs. Querschnittstudien Längs: Messung von Effekt auf Variable über Zeit (mehrmalige Messungen bei gleichen Testsubjekten) Quer: Messung von Variablen in Gruppe von Versuchspersonen "Unterschied: ""Quasi"" Experimente vs ""Echte"" Experimente" "Gruppierung der Versuchspersonen: es ist nur ein ""echtes"" Experiment, wenn Versuchspersonen randomisiert in Gruppen aufgeteilt werden (bei Quasi-Experimenten wählen die Personen selbst oder werden aufgrund bestimmter UV Ausprägung eingeteilt)" Gütekriterien einer Operationalisierung sind [...], [...], und [...]. Gütekriterien einer Operationalisierung sind Objektivität, Reliabilität, und Konstruktvalidität. Was bedeutet Objektivität für eine Operationalisierung? Durchführung, Auswertung und Interpretation dürfen nicht von irrelevanten Faktoren (z.B. durchführende Person) beeinflusst werden. Was bedeutet Reliabilität für eine Operationalisierung? So zuverlässig und genau wie möglich, keine Messfehler. (Überprüfbar durch: mehrere Tests für gleiche Variable) Was bedeutet Konstruktvalidität für eine Operationalisierung? Nur das wird gemessen/manipuliert, was gemessen/manipuliert werden soll, nichts anderes. Wie bestimmt man Konstruktvalidität empirisch? Man betrachtet die Korreleation mit anderen Variablen, die das gleiche Konstrukt messen sollen (konvergente Validierung) und Variablen, die ein anderes Konstrukt messen sollen (diskriminante Validierung) Die Voraussetzung dafür, dass alle Messaggregate reliabler sind als Einzelmessungen, ist, dass alle Messungen [...] sind. Die Voraussetzung dafür, dass alle Messaggregate reliabler sind als Einzelmessungen, ist, dass alle Messungen im gleichen Maße konstruktvalide sind. Konfundierung? Störvariablen verzerren den Messwert systematisch und nicht gleich in allen experimentellen Bedingungen (Bezeichnung?) Störvariablen verzerren den Messwert systematisch und nicht gleich in allen experimentellen Bedingungen (Bezeichnung?) Konfundierung? Fragebogen: Nicht Standardisiert vs. Teilstandardisiert vs. Vollstandardisiert Nicht: Keine vorformulierten Fragen, keine festen Antworten Teil: vorformulierte Fragen, keine festen Antworten Voll: vorformulierte Fragen, vorgegebene Antworten Unterschied: States vs. Traits? States: Momentane Zustände Traits: Andauernde Eigenschaften "Unterschied: ""Tests"" vs andere Items in Fragebögen." Tests haben eine objektiv richtige Antwort. 3 Konstruktionsprinzipien für Fragebögen? Rationale Itemkonstruktion Induktive Itemkonstruktion Externale Itemkonstruktion Was ist das Problem von geschlossenen Fragebögen? demand characteristics: Der Effekt, dass die Antworten der Versuchspersonen durch ihre Annahmen über den Versuch verzerrt werden. Durch die engere Gestaltung des Fragebogens kann dieser Effekt verstärkt werden. Wie sieht ein Fragebogen nach Likert Skala aus? Aussagen werden präsentiert, Vpn gibt auf Skala an, wie sehr sie diesen jeweils zustimmt. Unterschied: Motivierte vs unmotivierte Verzerrung bei Fragebögen? Motiviert: Selbstdarstellung, Soziale Erwünschtheit, faking good/bad Unmotiviert: Messfehler durch Vergleichsprozesse, Verankerungseffekte Was ist der Verankerungseffekt? Vorherige Angaben der Versuchsleitung beeinflussen Überlegungen eines Subjekts beim Beantworten einer Aufgabe. Unterschied: reaktive vs nicht-reaktive Messungen reaktiv: Messvorgang ist Vpn bekannt nicht-reaktiv: Messvorgang ist Vpn nicht bekannt → Verhalten wird nicht beeinflusst 2 Problemdimensionen bei Erhebung mit Fragebögen? motiviert / unmotiviert inhaltsabhängig / unabhängig 4 Probleme von Verhaltensbeobachtung als Messung? Eingeschränkte Objektivität Beobachtungsfehler Reaktivität Aufwändig (Zeit und Kosten) Was ist der Halo Effekt? Eine positive/negative Eigenschaft einer Person überscheint andere Eigenschaften und verzerrt Einschätzungen von unzusammenhängenden Eigenschaften. Recency Effekt vs Primacy Effekt Recency: Letzte Eindrücke fallen stärker ins Gewicht Primacy: Erster Eindruck fällt stärker ins Gewicht "Was sind ""Implizite Maße""?" Messen der automatischen Anteile des Verhaltens und Erlebens ohne bewusste Verhaltenssteuerung Was misst der implizite Assoziationstest? Der IAT-Wert gibt ein eine Messzahl für die die unbewusste Assoziation zwischen zwei Konzepten an an. (Friedlichkeit und Selbst, Hautfarbe und Valenz usw) Was lässt sich mithilfe des Affective Misattribution Paradigm messen? Ablauf: Versuchspersonen bekommen unbewusstes Bild als Primer (sehr kurz gesehen) und sollen anschließend chinesische Schriftzeichen als postitiv/negativ einschätzen → Valenz des Primers kann bestimmt werden, ohne dass Person diesen bewusst wahrnimmt Was ist Akquieszenz? Die Ja-Sage-Tendenz Unterschied semantisches Differential vs Likert Skala? Semantisch: zwei Pole (- ... 0 ... +) Likert: Wie stark stimmen sie zu? 0 .... n Was sind Ex-post-facto-Studien? Identifikation von Risikofaktoren, nachdem ein bestimmtes Ereignis (HIV, Amoklauf) eingetreten ist. Was ist die Schwäche von Ex-post-facto-Studien? Die Kausalrichtung kann nicht klar bestimmt werden (+ andere Schwächen, die korrelative Querschnittstudien auch haben) Was ist die Stärke von Ex-post-facto-Studien? Größtmögliche Konstruktvalidität und Reliabilität (per Definition) Was sind korrelative Querschnittsstudien? Gleichzeitige Messung mehrerer Variablen und Analyse der Zusammenhangstruktur Welche drei Bedingungen müssen erfüllt sein, damit ein kausaler Zusammenhang zwischen zwei Variablen hergestellt werden kann? 1. Korrelation/Kovariation 2. Zeitliche Vorgeordnetheit (Ausprägung UV liegt fest, bevor Ausprägung AV festliegt) 3. Ausschluss von Alternativerklärungen (keine Konfundierungen) Was ist eine Scheinkorrelation? Eine Drittvariable bedingt die beiden Variablen und erzeugt so einen scheinbaren Zusammenhang. Was sind korrelative Längsschnittstudien? Zwei Merkmale werden über Zeit gemessen → Analyse kreuzverzögertet Zusammenhänge (a1 → b2 und b1 → a2 vergleichen, welcher ist größer?) "Was sind die zwei Grundprinzipien des ""Echten"" Experiments?" Manipulation der UV (Gruppen unterscheiden sich nur Anhand der UV, randomisiert zugewiesen) und Kontrolle alle möglichen Störfaktoren 2 Arten von Störvariablen bei Experimenten? unsystematisch, inaccuracy: Reliabilität der Messung wird beeinflusst (Hitze, Frage falsch verstanden etc) systematisch, bias: Ergebnis wird systematisch verzerrt (Eigenschaften der Stichprobe, Künstlichkeit der Laborsituation, Versuchsleiter) Welche Arten von Störvariablen sind in Experimenten besonders kritisch? systematische Störfaktoren (bias), die sich zwischen den verschiedenen experimentellen Bedingungen unterschiedlich sind Was bedeutet interne Validität? Man kann plausible Alternativerklärungen für den Zusammenhang von UV und AV ausschließen. Was ist die Folge von Inaccuracy auf die statistische Auswertung? Varianz erhöht sich (statistische Power sinkt) Was ist die Folge von einem Bias auf die statistische Auswertung? Mittelwert verschiebt sich Begriffe für Überschätzen vs Unterschätzen des Effekts durch Konfundierung gleichsinnige Konfundierung vs gegensinnige Konfundierung (Bedeutung?) gleichsinnige Konfundierung vs gegensinnige Konfundierung (Bedeutung?) Begriffe für Überschätzen vs Unterschätzen des Effekts durch Konfundierung 3 Arten von Konfundierungen in Experimenten? situationsgebunden (Standardisierung) personengebunden (Randomisierung) mangelnde Konstruktvalidität bei der Manipulation (bessere Methoden aussuchen) Wie kann man nach Störvariablen parallelisieren? Die Störvariablen werden vorher erhoben und in eine Rangreihe gebracht, nach dieser Rangreihe werden nun Gruppen eingeteilt. (1 2 2 2 ... 2 2 1) → Störvariable ist dann nahezu gleichverteilt Was ist ein propensity score? Die Wahrscheinlichkeit, dass eine Person zur Testgruppe gehört, gegeben der Störvariablen. Wenn diese durchschnittlich in Test- und Kontrollgruppe gleich sind (d.h. es kann keine Vorhersage über Gruppenzugehörigkeit aufgrund der Störvariablen getroffen werden), können wir eine systematische Unterscheidung durch Störvariablen ausschließen. Man will testen, ob Schüler bei Beobachtung besser arbeiten. Sie haben Angst, dass die Schulbildung hier eine Störvariable ist. Ist es problematisch für die internen Validität, nur Gymnasiasten zu betrachten? Nein, die interne Validität ist gegeben, lediglich die externe Validität ist nicht gegeben. Was ist externe Validität? Wie gut kann der Effekt generalisiert werden, wenn man andere Personen, Situationen, Orte und Zeitpunkte betrachtet? probabilistische Stichprobe vs nicht-probabilistische Stichproben? Probabilistisch: Die Wahrscheinlichkeit, mit der ein beliebiges Element aus der Population in die Stichprobe gelangt, ist bekannt oder kontrollierbar. → global repräsentativ für Population Nicht-Probabilistisch: Wahrscheinlichkeit unbekannt → nur bedingt repräsentativ Wann sind Zufallsstichproben unabdingbar? Wenn Zustände in einer Population erfasst/beschrieben werden sollen. Wann reicht eine nicht-probabilistische Stichprobe? Wenn es um den Nachweis eines Effekts in der Population geht. Wichtig, hier muss drauf geachtet werden, dass keine Konfundierung durch die Eigenschaften der Stichprobe stattfindet. Was sagt die externe Validität über die Wirklichkeitstreue einer Situation? N-I-C-H-T-S. Sie zeigt nur einen konzeptuellen Zusammenhang außerhalb des Labors. (Beispiel: unterwasser Lernen ist nicht zwingend lebensecht) Was besagt eine Hypothese bezüglich eines additiven Effekts? mehrere, unabhängige Variablen (Prädiktoren) bedingen die AV simultan Was ist eine Moderatorhypothese? Die Stärke oder die Richtung des Effekts der UV auf die AV hängt von einer dritten Variable, der Moderatorvariable ab (interaktiver Effekt) Was ist eine Mediatorhypothese? Die Annahme, dass der Effekt der UV auf die AV über eine intervenierende Variable vermittelt ist (indirekter Effekt) ( A → B → C) Wie erkennt man Interaktionseffekte/Moderatorvariablen? Man betrachtet die Unterschiede in den Unterschieden der AV (bei verschiedener UV Ausprägung) bei veränderten MVs . Die Linien eines Liniendiagrams (y: AV, x UV, eine Linie pro MV) verlaufen nicht parallel Welche 2 Möglichkeiten gibt es, Mediatorhypothesen zu überprüfen? 1. Auspartialisieren, statistische Kontrolle der IV und Betrachtung, ob der Effekt der UV auf die AV dann wegfällt (Varianz der IV auf 0 setzen) 2. Experimentelle Kontrolle der IV und Prüfung, ob der Effekt der UV auf die AV davon beeinflusst wird Was sind mehrfaktorielle Designs? Ein Versuchsplan, der aus mehreren UVs besteht. Welche 3 Gründe gibt es, mehrere UVs in seinen Versuch zu integrieren? (Natur) theoretische Natur: Moderatorvariablen prüfen methodisch strategischer Natur: A) Konstruktvalidität wird getestet, indem bekannter Moderator zum Einsatz kommt und Effekt betrachtet wird B) Generalisierbarkeit wird verbessert, indem mehrere verschiedene Umstände getestet werden Welche 3 Gründe gibt es, mehrere Faktorstufen von UVs in seinem Experiment zu überprüfen? Nicht lineare Effekte zeigen Kontrollbedingungen: Baseline ermitteln interne Validität sichern (ohne Manipulation wäre der Effekt nicht eingetreten) Was ist vollständige Datenerhebung im Vergleich zu unvollständiger? vollständig: alle Bedingungskombinationen sind realisiert (bei mehreren UVs) Was sind Faktorstufen von UVs? Unterschiedliche Grade der Ausprägung/Manipulation (Gruppe mit 6 Wochen Therapie vs Gruppe mit 1 Jahr Therapie) Wie kann man Mediator- und Moderatorvariablen einfach unterscheiden? Moderator: Unabhängigkeit der beiden UVs Mediator: Abhängigkeit zwischen den beiden UVs 3 typische Versuchsdesigns mit Messwiederholungen? 1. Die Zeit selbst ist eine unabhängige Variable 2. Vorher-Nachher Hypothesen 3. Intraindiviuelle Bedingungsvariation (Alle Stufen für alle Personen) Wie verhält es sich mit personenbezogene Fehlereinflüssen bei intraindividueller Faktorenvariation? Solange die Fehler über Zeit stabil sind, sind die Fehlereinflüsse perfekt parallelisiert. Was sind Sequenzeffekte bei Versuchen mit Messwiederholung? Die Reihenfolge der Messung könnte einen Einfluss auf die Messwerte haben. (Sensibilisierung für die Fragestellung, Übung, Ermüdungseffekte etc) Was kann man tun, um die Nachteile von Messwiederholungen zu umgehen? Intraindividuelles Ausbalancieren Interindividuelles Ausbalancieren (Messzeitpunkte zeitlich stärker trennen, Variation des Stimulusmaterials) Was ist intraindividuelles Ausbalancieren? Man macht mehrere Durchgänge mit der gleichen Versuchsperson in mehreren Bedingungen. Bsp: 4 Durchgänge in 2 Bedingungen A,B nach dem Muster ABBA. Was ist der Sinn von Ausbalancieren nach ABBA? Lineare Sequenzeffekte mitteln sich heraus und beeinflussen den Effekt UV → AV nicht. (Die gemittelte Differenz bleibt gleich) Was ist die Schwäche von Ausbalancieren nach ABBA? Nicht-Lineare Sequenzeffekte können nicht kontrolliert werden. Was ist vollständiges interindividuelles Ausbalancieren? Bei mehreren Faktorstufen werden alle möglichen Reihenfolgen realisiert (in mehreren Versuchsgruppen). Wie funktioniert unvollständiges interindividuelles Ausbalancieren? Ähnlich zu vollständig, jedoch nicht mehr alle Reihenfolgen, sondern so viele Reihenfolgen, dass jede Bedingung mal an jeder möglichen Position stand. (Lateinisches Quadrat) Was kann man mit unvollständigem interindividuellen Ausbalancieren kontrollieren? Lineare und nicht-lineare Sequenzeffekte auf unmittelbar benachbarte Bedingungen Wie viele Gruppen braucht man beim vollständigen interindividuellen Ausbalancieren? Anzahl Faktorstufen in der Fakultät In welchen zwei Situationen kann ein Versuchsleiter unerwünschte sozialpsychologische Effekte bei den Vpns auslösen? Bei der Anwerbung (Motivation zur Teilnahme) Bei der Durchführung (Evaluationsangst, Rollenausübung, Sympathie/Antipathie) Was ist der Pygmalion Effekt? (Rosenthal Effekt) Erwartungen von Lehrern/Versuchsleitern beeinflussen die Leistung der Schüler/Vpns proportional. Dieser Effekt ist einer der Gründe für die Verwendung von Doppelblindstudien. Was sind Demand Artefakte? Von Vpns generierte Hypothesen über das Experiment beeinflussen das Ergebnis. Was sind Demand-Characteristics? Details der Untersuchung, die Hinweisreize liefern, woraufhin die Versuchspersonen Hypothesen über die Natur des Experiments bilden. 3 Möglichkeiten zur Kontrolle von Demand Artefakten? 1. Untersuchung der Hypothesen bei Vorstudien 2. intransparente Messverfahren oder tests 3. Fülleraufgaben (Coverstories etc) Was ist das Problem an Coverstories bei Experimenten? Belügen der Vpns ist ethisch bedenklich Was ist ein funneled debriefing? "Erfassung, ob und in welchem Ausmaße die Vpn die wahre Natur des Experiments erfasst hat. (Eventuell auch Aufklärung) Zuerst offene Fragen: ""Haben sie irgendwelche Meinungen über das Experiment?"" Dann gezielte Fragen: ""Warum denken sie haben wir X gemacht?"" Zuletzt geschlossene Fragen: ""Haben sie gemerkt, dass wir Y gemacht haben?""" Wie kann man soziale Erwünschtheit aus einer Befragung auspartialisieren? Man baut eigene Fragen ein, die soziale Erwünschtheit messen (ich ernähre mich stets Gesund, ich lasse andere immer ausreden) und rechnet diesen Einfluss dann statistisch raus. 3 Gründe fürs Auspartialisieren? 1. Scheinkorrelationen/Störvariablen 2. additive Effekte untersuchen 3. Mediatorvariablen untersuchen Was ist die Voraussetzung für die Bildung von Mittelwerten bei Fragebögen? Die Antwortkategorien sind äquidistant → Intervallskala Was ist eine Klumpenstichprobe? bereits in Teilmengen organisiert, die Teilmengen werden zufällig aus der Menge der Teilmengen gezogen (Schulklassen, Kliniken) Was ist eine mehrstufige Stichprobe? Erst Klumpen, dann nochmal Stichprobe aus den Klumpen Was ist eine geschichtete Stichprobe? Es wird auf einer vordefinierten Teilpopulation zufällig gezogen (Alter, Geschlecht, Bildungsgrad) Was ist Parsimonität? Sparsamkeit von Definitionen, auf denen eine Theorie aufbaut Welche vier Typen von Vpns unterscheidet Orne? Good Subjects Bad Subjects Faithful Subjects Evaluation Apprehension Unterschied: konzeptuelle vs operationalisierte Hypothese? Konzeptuell: folgt direkt aus Theorie Operationalisiert: konkretisierte Hypothese in Bezug auf spezifischen Versuchsplan → macht Aussage über bestimmten statistischen Parameter Wie kann man Messfehler verhindern? Das gleiche Merkmal zu verschiedenen Zeitpunkten in verschiedenen Situationen mit unterschiedlichen Messmethoden messen. Was ist eine Guttman Skala? Eine Reihe von Aussagen zu einem Thema wird präsentiert, beginnend mit sehr allgemeinen/harmlosen Aussagen bis hin zu sehr spezifischen/extremen. Es wird gemessen, bis zu welcher Aussage zugestimmt wird. Man kann mit Ordinalskalen keine Mittelwerte bilden, was wird jedoch stattdessen oft mit den Daten gemacht? Aggregation über mehrere Antwortmöglichkeiten → 40% fühlen sich mindestens einmal die Woche gestresst (einmal die Woche + täglich) Wie funktioniert der Lexical Decision Task? Testpersonen müssen bei Wörtern identifizieren, ob es sich um ein reales oder erfundenes Wort handelt. Reale Wörter, die zur Stimmungslage des Testperson passen, werden schneller erkannt. Wie kann man personengebundene Störvariablen eliminieren? Die Teilnehmer randomisiert auf die verschiedenen Versuchsgruppen aufteilen. Wie kann man situationsgebundene Störvariablen eliminieren? Standardisierung des Studienablaufs Explanans vs Explanandum? Explanandum: Das Phänomen, das erklärt werden soll Explanans: Allgemeine Sätze die zur Erklärung hergenommen werden Wie viele Typen der Nichtreaktivität gibt es? 6 (0-5) Was ist rationale Itemkonstruktion? Rein theoriegeleitete Itemkonstruktion → Fragen werden aus der Definition eines Konstrukts abgeleitet Was ist induktive Itemkonstruktion? Rein datengeleitete Itemkonstruktion → hoch korrelierende Fragen werden zu einer Skala zusammengefasst Was ist externale Itemkonstruktion? Datengeleitete Itemkonstruktion, zielt auf Fragen, die zwischen Extremgruppen trennen